http://www.abbs.info e-mail:[email protected]

ISSN 0582-9879                                          ACTA BIOCHIMICA et BIOPHYSICA SINICA 2003, 35(8): 768–773                                    CN 31-1300/Q

 

Short Communication

Characterization of the Copy Number of RIRE10 Retrotransposon and Transcriptional Activity of Its LTR in Rice Genome

WANG Rong1,2, HONG Guo-Fan1,2*, HAN Bin1*

( 1National Center for Gene Research, Shanghai Institutes for Biological Sciences, the Chinese Academy of Sciences, Shanghai 200233, China; 2Institute of Biochemistry and Cell Biology, Shanghai Institutes for Biological Sciences, the Chinese Academy of Sciences, Shanghai 200031, China)

 

Abstract        A full-length Ty3-like retrotransposon, named RIRE10, was identified on the long arm of chromosome 4 in rice genome. The internal region between two LTRs had another open reading frame in the region upstream of gag-pol sequence. The transcripts from LTR region were detected by Northern blot hybridization and RT-PCR. To assess the activity of RIRE10 in rice genome, the copy number of its internal region and long terminal repeat (LTR) domain were determined by dot blot analyses. Nearly 900 solo-LTR of the RIRE10 retrotransposon exist in rice genome, apart from those LTRs that flank 65 intact RIRE retrotransposons. Based on the experimental results, the retrotransposition of RIRE10 was speculated to be influenced by two factors: transcriptional activity of LTR region and homologous recombination resulting in solo-LTR.

 

Key words     Oryza sativa; Ty3-type retrotransposon; transcription

_______________________________________

Received: April 17, 2003        Accepted: June 2, 2003

This work was supported by the grants from the Ministry of Science and Technology, the Chinese Academy of Sciences and the Shanghai Municipal Commission of Sciences and Technology

*Corresponding authors:

HONG Guo-Fan: Tel, 86-21-64822885; Fax, 86-21-64825775; e-mail, [email protected]

HAN Bin: Tel, 86-21-64845260; Fax, 86-21-64825775; e-mail, [email protected]

 

水稻逆转录转座子RIRE10拷贝数与LTR区转录活性的鉴定

王嵘1,2     洪国藩1,2*     韩斌1*

( 1中国科学院上海生命科学研究院国家基因研究中心, 上海200233; 2中国科学院上海生命科学研究院生物化学与细胞生物学研究所, 上海200031 )

 

摘要       在水稻第四号染色体的长臂上鉴定了一个结构完整的Ty3型逆转录转座子RIRE10 RIRE10LTR间的中间区域在gag-pol的上游还包含另一个开放阅读框。 通过RT-PCRNorthern 印迹杂交检测到来自LTR区的转录产物; 根据点杂交结果, 鉴定出包含中间区域的RIRE10成员的个数以及LTR区的拷贝数。 除了65个完整的逆转录转座子所具备的两个LTR, 水稻基因组还含有近900RIRE10solo-LTR LTR区的转录以及导致solo-LTR产生的同源重组可能影响了RIRE10成员在水稻基因组中的转座活性。

 

关键词   栽培稻; Ty3型逆转录转座子; 转录

 

逆转录转座子与逆转录病毒有相似的复制过程: 首先转录出RNA, 然后以RNA为模板通过逆转录酶合成双链DNA, 最后整合酶将双链DNA插入染色体DNA[1] 因而逆转录转座子的每一次转座都伴随着拷贝数的增加。 根据结构特点, 逆转录转座子分成两类: 长末端重复(long terminal repeat, LTR)逆转录转座子与非长末端重复(non-LTR)逆转录转座子。 LTR逆转录转座子根据pol区基因的顺序与序列的相似性又分成两类: Ty1-copiaTy3[2]

人们采取两种互补的方法来研究LTR逆转录转座子在水稻中的拷贝数。 一种是搜寻水稻基因组BAC数据库, 归纳出LTR逆转录转座子的种类与数目[3]; 另一种方法是用逆转录转座子不同区域的片段作为探针杂交基因组DNA, 计算逆转录转座子的拷贝数[4,5] 伴随拷贝数的鉴定, 人们也观察到逆转录转座子在植物基因组中的活性。 在水稻中, 检测到了 GAG蛋白的表达以及一个非全长的Ty3型水稻逆转录转座子RIRE9在正常生长情况下的转录[6,7] 而水稻Tos17是一个在组织培养条件下会发生转座的Ty1-copia型逆转录转座子[8]

虽然人们检测到逆转录转座子的转录、 翻译与转座, 但不同LTR逆转录转座子在水稻基因组中的拷贝数不同[3], 暗示着水稻基因组与不同LTR逆转录转座子间可能存在着互相平衡, 互相制约的共生关系。

在完成BAC4949(GenBank登录号: AL627350)的序列测定与分析后, 我们找到了一个结构完整的Ty3型逆转录转座子。 与已报道的其他水稻Ty3型逆转录转座子比较, 该逆转录转座子是一个新家族的成员, 我们将其命名为RIRE10 (Rice Retrotransposon 10) 通过RT-PCRNorthern 印迹杂交, 在正常水稻组织中检测到来自LTR区的转录物。 基因组DNA点杂交计算分析后, 我们发现LTR区的拷贝数是内部区域拷贝数的11倍。 900RIRE10 solo-LTR的存在说明导致solo-LTR的同源重组可能抑制了RIRE10在水稻基因组中的扩增。 LTR区转录片段的大小暗示LTR区的转录调节位点可能影响了RIRE10的完整转录以及邻近基因的表达。

 

1    材料和方法(Materials and Methods)

1.1   水稻材料

水稻种子是籼稻广陆矮4(Oryza sativa ssp. indica Guangluai 4), 由中国水稻研究所提供;种子用2%的漂白粉精消毒, 抽真空后于37 ℃发芽; 将发芽后(24)的种子移至网上水培(30 ,光照12 h), 根据实验需要, 24周的水稻作为材料。 将发芽后的种子于30 ℃暗培养来获取水稻黄化苗。 愈伤组织由种子盾片诱导, 每两周继代一次。

1.2   RT-PCR 扩增与Northern印迹杂交

1.2.1       水稻总RNA的抽提      我们用RNAeasy Mini试剂盒(Qiagen)抽提水稻苗或愈伤组织总RNA 抽提到的总RNA用无RNaseDNase (Promega)处理防止可能的基因组DNA污染。 RNA浓度由GeneQuantII 分光光度计(Pharmacia Biotech)检测。

1.2.2       RT-PCRNorthern印迹杂交     1 μg叶或根的总RNA为模板, oligo (dT)为引物, MMLV逆转录酶(Clontech)催化合成第一链。 第二链PCR扩增的酶是Advantage cDNA PCR聚合酶(Clontech), 引物为CTT TAT TTT CGC CGT TTGAGC CGA TAC AGG TTT AC 反应条件: 95 ℃变性, 30 s; 50 ℃退火, 15 s; 68 ℃延伸, 2 min; 35 循环。 对照组仅是第一链合成时用水取代逆转录酶, 其他操作均与实验组相同。 RT-PCR产物经低熔点胶纯化, 测序检测后用于Northern印迹杂交, RT-PCR产物的序列登录号为: AJ555842 Northern印迹杂交操作依照Gene Images Alkphos Direct system说明书(Amersham)

1.3   Southern 印迹杂交与点杂交

 

1.3.1       水稻基因组总DNA的抽提         20 mL7 mol/L尿素、 0.35 mol/L氯化钠、 50 mmol/L Tris-HCl (pH 8.0) 20 mmol/L EDTA (pH 8.0) 6.25%重蒸酚的抽提缓冲液抽提10 g水稻苗的总基因组DNA

1.3.2       Southern 印迹杂交       BamHI HindIII完全酶切10 μg基因组DNA, 每一种酶切产物分成三份电泳, 转膜后的基因组DNA酶切片段与来自LTR区的一个探针(Un)和来自内部区域的两个探针(Ext Gag)分别进行杂交。 杂交探针是BAC 为模板的PCR片段: 扩增Un探针的引物是TAT ATC CCC CCC ATT CGCCA ATG GCT CGG ATT TC; 扩增Ext探针的引物是CAG TTC CCA CGG TTT TGCCT CAG TCG AAG AAA CG;扩增Gag探针的引物是TCA CCA GCT AAG AGG ACACC GAA GTT GTT GAG CG PCR反应条件是: 95 ℃变性, 30 s; 54 ℃退火, 15 s; 72℃延伸, 2 min; 35 循环。 DNA聚合酶是rTaq(TaKaRa)

1.3.3       点杂交PCR扩增片段         Ext Un分别作为探针进行水稻基因组DNA点杂交, 从而计算内部区域以及LTR区的拷贝数。 具体方法如下。 (1) GeneQuantII 分光光度计计量水稻基因组DNA以及片段Ext Un的浓度。 (2) 人工点上38 ng全水稻基因组DNA, 共点六点; 在同一张膜上点上含有Ext片段或 Un片段的梯度稀释液, 每种梯度稀释液重复23; 经预杂交实验后, Ext片段的梯度稀释液为5 ng 1 ng 0.5 ng 0.1 ng 50 pg 10 pg; Un片段的梯度稀释液是3.5 ng 0.7 ng 0.14 ng 70 pg 14 pg 7 pg (3) 与相应的探针杂交后, 对杂交点扫描; 首先根据每个梯度的平均灰度值与对应质量的对数值作出线性关系式, 利用该等式计算出基因组DNA平均灰度值对应的探针的质量数, 再根据Kalendar[9]的方法计算拷贝数。

 

2    结果(Results)

2.1   RIRE10的结构特点

我们使用BLASTX搜索GenBank分析BAC4949, 发现4620452158 bp这段BAC序列编码逆转录转座子Gal-Pol多聚体蛋白。 随后我们通过Staden Package 中的重复序列分析工具、 BLAST2以及同源序列搜索确定了该逆转录转座子的完整结构, 并将其命名为RIRE10 RIRE10全长13 842 bp, 5LTR 3LTR与中间区域的长度分别为3819 bp 3849 bp6174 bp RIRE10中间区域的pol基因顺序为逆转录酶(rt)-RNaseH(rh)-整合酶(int), 因而属于Ty3型。 RIRE10具有典型LTR型逆转录转座子的结构特点(1) 5LTR3LTR的左右两个边界序列为TG..CA的倒转重复; 整个RIRE10序列的两边界是5 bp的基因组DNA(ATCTT)的正向重复。 5LTR下游序列中, 有一与tRNAiMet 3′末端18个碱基序列互补的引物结合位点(PBS); 3LTR上游的7个嘌呤形成了多嘌呤位点(PPT)

Fig.1       Schematic representation of RIRE10 structure

5 bp (ATCTT) target site direct duplication region (TSD) caused by retrotransposition was indicated by black triangle; two triangles in LTR boxes showed inverted repeats (TG..CA) at the end of LTR. Ext, Gag, Pol represented three hypothetical proteins encoded by internal region. PBS, PPT showed primer binding site and polypurine tract respectively.

 

RIRE10的两个LTR序列有0.5%的差异, 共有17个区域的碱基发生了改变, 其中14处是碱基替换, 其余三处是由于微卫星的重复数不同导致的。 RIRE10LTR区没有某些逆转录转座子LTR区中存在的以短区域作为重复单位的重复, 而是有多类型的微卫星DNA (C)n单碱基重复, (CT)n两碱基重复, (T4C)n五碱基重复。 3LTR, (CT)n(C)n微卫星的重复数分别为138, 而在5LTR区中(CT)n(C)n微卫星的重复数分别为1715 3LTR, 距离(CT)n微卫星重复2碱基处有[(TC)3C4G3C]2重复, 5LTR区的同一位置是(TC)3C3G3C

RIRE10中间区域可能编码的蛋白质GAGPOL位于同一转录框。 gag序列的上游还有另一开放阅读框, 可能编码伸展蛋白(extension protein, Ext) 的同源物。 RIRE10GAG蛋白、 逆转录酶、 整合酶分别具有逆转录病毒中相应蛋白质的结构域模式。 GAG蛋白的核酸结合结构域具有CX2CX4HX4C的特征, 而整合酶具有三个典型的亚结构域: N末端的HHCC锌指模式; 中间区域的D(35)E模式; 碳末端为G-D-X19-K-L-X2-R-T-X-GPY/F(X代表任何氨基酸)GPY/F模式, 而且在GPY/F模式后还有60个氨基酸的染色质结构域(chromodomain)同源序列。 2是已报道的水稻Ty3型逆转录转座子整合酶碳末端结构域的比较。 RIRE7, 其他逆转录转座子的整合酶在GPY/F模式后还有一个染色质结构域。

Fig.2       Alignment of the C-terminal domain of integrase of Ty3-like retrotransposons in rice

Gray boxes represented conserved GPY/F modules and dots indicated gaps. Black arrow showed the start site of chromodomain sequence. The accession numbers for the elements are as following RIRE2, AB030283; RIRE10, AL627350; RIRE3, AB014738; RIRE8B, AB014741.1; RIRE7, AB033235.

2.2   LTR区的转录

LTR区包含逆转录转座子起始与终止转录以及各种调节转录的信号序列。 我们通过植物顺式调控元件预测软件分析了LTR区的序列, 找到了多个TATA盒与转录终止信号。 GeneScan预测RIRE10LTR区有转录产物。 我们在软件预测的外显子区设计了引物, 通过RT-PCR反应扩增得到特异的738 bp长的LTR区片段[3(A)] RT-PCR产物的序列登陆号为: AJ555842 我们用此片段作为探针分析了不同水稻组织中LTR区的转录[3(B)] 在所检测的组织里, 都有800 bp的条带; 仅在愈伤组织中检测到近7 kb的大片段。 除绿苗根外, 在其他组织中还观察到2.61 kb的片段。

Fig.3       Detection of the transcripts of LTR region

(A) Amplification of LTR transcripts from leaf (L) or root (R) sample by RT-PCR. Lane 1 (Lc) and 2 (Rc) were the control groups. The marker (M) order is 2 kb, 1 kb, 750 bp, 500 bp, 250 bp, 100 bp(up to down). (B) 30 μg total RNA, from green seedling leave (GL), green seedling root (GR), etiolated seedling leave (EL), etiolated seedling root (ER), C(calli) were separated on formuldehyde gel then transferred to N+-nylon membrane. Number on right indicated the lengths of bands. Ribosomal RNA was stained with ethidium bromide to verify the equal loading of samples and shown at the bottom.

 

2.3   RIRE10的拷贝数

逆转录转座子的典型特征就是每一次转座都伴随着逆转录过程与拷贝数的增加, 因而通过检测基因组中逆转录转座子的拷贝数, 可估计其转座活性。 我们通过Southern印迹杂交与点杂交来检测RIRE10在水稻基因组中的活性。 RIRE10三个区域的DNA片段被选作探针杂交基因组DNAHindIIIBamHI酶切片段。 4(A)所示, 三个探针的杂交图谱都是弥散型条带, Un探针的杂交图的弥散程度大于ExtGag 探针的。 弥散型的基因组酶切杂交图说明基因组中存在较高拷贝数的RIRE10序列, 而且含有LTR区的序列的拷贝数要大于含有内部区域的序列的拷贝数。 基因组酶切片段杂交结果表明水稻中存在着RIRE10家族的其他成员, 然而不能得出成员个数。 因而我们通过点杂交计算RIRE10的拷贝数, 4(B) 4(C)是杂交点的灰度值与质量的对数值作图得到的线性方程式。 根据这个等式, 38 ng基因组DNA的灰度值相当于4.968 pgExt(866 bp)的灰度值, 而相当于45.242 pgUn(561 bp)的灰度值。 水稻单倍体基因组为4.3×108 bp, 因而在每个单倍体水稻基因组中, (1024±19)LTR, (65±8)个具中间结构的RIRE10成员。 同时, 我们用RIRE10中间区域序列(6174 bp)搜寻JaponicaBAC, 共找到51个同源性在93%以上的RIRE10成员。 实验值(65)大于BAC文库搜索值(51)可能来自以下原因: 同源搜寻时, 我们筛出了同源区域小于4 kb的序列;BAC文库中可能没有包括某些含有RIRE10同源序列的基因组异染色体片段。 而基因组点杂交则不受这两个因素影响。

Fig.4       The copy number of RIRE10 internal or LTR region in rice genome

(A) Southern blot hybridizations. Completely digested genomic DNA was run on 0.8% agarose gel. Three nylons were separately probed with Un, Ext or Gag fragments. Marker was indicated on left. B, 3 μg BamHi; H, 3 μg HindIII. (B, C) The equations and diagrams of dot blots using Ext or Un as probes.

 

3    讨论(Discussion)

逆转录转座子的转录以及与转座相关的蛋白质的翻译都依赖着寄主的转录与翻译系统, LTR区的序列则参与对逆转录转座子转录的调控。 整合酶是逆转录转座子以自身序列为转录模板, 利用寄主的转录与翻译系统在寄主细胞中合成的。 整合酶是预插入复合物的一个成员, 通过与寄主DNA以及其他蛋白质的相互作用影响着逆转录转座子的基因组插入位点[10,11] 以前人们认为整合酶羧基末端不具有结合特异DNA序列的结构域。 然而随着对整合酶的研究, 人们发现整合酶的羧基末端参与了特异DNA序列的识别。 Ty3具有专一插入RNA基因的特点, 如果用MMLV病毒整合酶羧基末端取代Ty3整合酶羧基末端, 这样构建出的Ty3/MMLV嵌合整合酶使得Ty3丢失了专一插入的特点[12] RIRE10整合酶羧基末端具有染色质结构域(chromodomain)的同源序列。 染色质结构域最初在果蝇多线蛋白(Polycomb, Pc)与人异染色质蛋白(HP1)中发现, 功能分析发现这种蛋白质序列模式参与了染色质位点的结合[13] RIRE7Tos17都发现了插入位点的偏爱性[14,15] 羧基末端无染色质结构域的RIRE7倾向插入近着丝粒区异染色质中的串联重复序列。 51个与RIRE10同源的逆转录转座子大多位于基因富聚区。 RIRE10整合酶可能通过羧基末端与DNA序列或其他蛋白质作用而对插入位点进行选择。

全长RNA的转录是逆转录转座子转座的第一步。 RIRE10的全长RNA至少有10 kb, 因而在愈伤组织检测到的7 kb大片段仍是RIRE10型逆转录转座子的不完全转录产物。 不同大小的LTR短片段转录产物可能完全来自RIRE10LTR, 也可能是邻近基因起始或终止于LTR区的转录产物。 我们推测RIRE10LTR区转录起始或终止位点以及其他转录调控序列可能参于邻近基因的表达调控, LTR区的转录也可能影响到RIRE10自身的完整转录。

逆转录转座子插入寄主基因组后, 仍面临着序列丢失的危险。 在水稻的进化过程中, 逆转录转座子RS1家族的许多成员的整合酶区域都发生了原位缺失[16] 许多LTR逆转录转座子甚至丢失了中间区域与一个LTR, 仅剩下一个LTR作为插入事件的痕迹[9] 分析数据库中RIRE10 中间区域的51个同源序列时, 我们也发现多数成员的中间区域序列有不同片段的缺失、 插入与异位。 RIRE10LTR包含(CT)n两碱基重复。 两核苷酸微卫星不仅用于系统演化的研究, 而且人们发现两碱基重复还参与调节同源重组活性。 Gendrel[17]研究发现,(CA/GT)n重复影响了酵母的同源重组。 大肠杆菌RecA蛋白与酿酒酵母RadS1的重组蛋白质对含有GT CT CA两碱基重复的单链DNA有很强的结合[18] 排除完整结构成员的约140LTR, 还有近900RIRE10 LTR(solo-LTR)存在于水稻基因组中。 这些LTR可能是RIRE10型逆转录转座子发生同源重组, 丢失了中间区域和一个LTR后而剩下的LTR

LTR型逆转录转座子与有机体在长期共同适应与演化的过程中, 有机体对逆转录转座子的转录、 翻译以及位点的插入等生命周期有不同的调控; 而逆转录转座子LTR区的激素效应元件或增强子序列, 可能参与了邻近基因的转录调节。 RIRE10 LTR区的转录以及大量RIRE10 solo-LTR的存在, 反映了水稻基因组对RIRE10转座活性的一种可能调节机制。

 

References

1     Boeke JD, Corces VG. Transcription and reverse transcription of retrotransposons. Annu Rev Microbiol, 1989, 43: 403434

2Xiong Y, Eickbush TH. Origin and evolution of retroelements based upon their reverse transcriptase sequences. EMBO J, 1990, 9: 33533362

3     McCarthy EM, Liu J, Lizhi G, McDonald JF. Long terminal repeat retrotransposons of Oryza sativa. Genome Biol, 2002, 3: research 0053.10053.11

4     Hirochika H, Fukuchi A, Kikuchi F. Retrotransposon families in rice. Mol Gen Genet, 1992, 233: 209216

5Wang S, Liu N, Peng K, Zhang Q. The distribution and copy number of copia-like retrotransposons in rice (Oryza sativa L.) and their implications in the organization and evolution of the rice genome. Proc Natl Acad Sci USA, 1999, 96: 68246828

6     Vicient CM, Jskelinen MJ, Kalendar R, Schulman AH. Active retrotransposons are a common feature of grass genomes. Plant Physiology, 2001, 125: 12831292

7     Li ZY, Chen SY, Zheng XW, Zhu LH. Identification and chromosomal localization of a transcriptionally active retrotransposon of Ty3-gypsy type in rice. Genome, 2000, 43: 404408

8     Hirochika H, Sugimoto K, Otsuki Y, Tsugawa H, Kanda M. Retrotransposons of rice involved in mutations induced by tissue culture. Proc Natl Acad Sci USA, 1996, 93: 77837788

9     Kalendar R, Tanskanen J, Immonen S, Nevo E, Schulman AH. Genome evolution of wild barly (Hordeum spontaneum) by BARE1 retrotransposon dynamics in response to sharp microclimatic divergence. Proc Natl Acad Sci USA, 2000, 97: 66036607

10    Downs JA, Jackson SP. Involment of DNA end-binding protein Ku in Ty element retrotransposition. Mol Cell Biol, 1999, 19: 62606268

11   Malik HS, Eickbush TH. Modular evolution of the integrase domain in the Ty3/Gypsy class of LTR retrotransposons. J Virol, 1999, 73: 51865190

12    Dildine SL, Respess J, Jolly D, Sandmeyer SB. A chimeric Ty3/Moloney murine leukemia virus integrase protein is active in vivo. J Virol, 1998, 72: 42974307

13    Platero JS, Hartnett T, Eissenberg JC. Functional analysis of the chromo domain of HP1. EMBO J, 1995, 14: 39773986

14    Kumekawa N, Ohmido N, Fukui K, Ohtsubo E, Ohtsubo H. A new gypsy-type retrotransposon, RIRE7: Preferential insertion into the tandem repeat sequence TrsD in pericentromeric heterochromatin regions of rice chromosomes.  Mol Genet Genomics, 2001, 265: 480488

15    Yamazaki M, Tsugawa H, Miyao A, Yano M, Wu J, Yamamoto S, Matsumoto T et al. The rice retrotransposon Tos17 prefers low-copy-number sequences as integration targets. Mol Genet Genomics, 2001, 265: 336344

16    Liu B, Wendel JF. Retrotransposon activation followed by rapid repression in introgressed rice plants. Genome, 2000, 43: 874880

17   Gendrel CG, Boulet A, Dutreix M. (CA/GT) (n) microsatellites affect homologous recombination during yeast meiosis. Genes Dev, 2000, 14: 12611268

18    Biet E, Sun J, Dutreix M. Conserved sequence preference in DNA binding among recombination proteins: An effect of ssDNA secondary structure. Nucleic Acids Res, 1999, 27: 596600